import nltk
import re
import pprint


f = open('/home/celso/Desktop/Celsoland/Projeto de Formatura/codigo/palmeirasportuguesamini','rU')
text = f.read()
pattern = r'(\d+\s?[a-z]\s?\d+)|\w+|[^\w\s]+'
tokens = nltk.tokenize.regexp_tokenize(text, pattern)

times = []
countPalmeiras = 0
countCorinthians = 0
countPortuguesa = 0
countSantos = 0
resultadoJogo = ''

for word in tokens:
    
    if word == 'Palmeiras':
           countPalmeiras += 1
    elif word == 'Corinthians':
            countCorinthians += 1
    elif word == 'Portuguesa':
            countPortuguesa += 1
    elif word == 'Santos':
            countSantos  += 1
    times = [('Palmeiras',countPalmeiras),
             ('Corinthians',countCorinthians),
             ('Portuguesa',countPortuguesa),
             ('Santos',countSantos)]

    if re.search('\d+\s?[a-z]\s?\d',word):
        resultadoJogo = word

print times

f.close()
time1 = ''
time2 = ''
maior1 = 0
maior2 = 0
for dupla in times:
    print "dupla0: " + dupla[0]
    print "dupla1: " + str(dupla[1])
    
    if maior1 < dupla[1]:
        time2 = time1
        maior2 = maior1
        
        time1 = dupla[0]
        maior1 = dupla[1]
        
    elif maior2 < dupla[1] and maior1 > dupla[1]:
        time2 = dupla[0]
        maior2 = dupla[1]


print "Time1: " + time1
print "Time2: " + time2
print 'Resultado: ' + resultadoJogo
